必须强调指出的是:统计学只能帮助人们发现规律,而不能创造规律。至今仍有一些人不能正确地看待统计学的作用, 尤其是对试验设计的重要性认识模糊。他们不善于在试验研究开始之前,就从统计学的角度去考虑应当如何确定试验因素、观测指标、受试对象(包括种类和数量);如何合理地安排试验, 以便用最少的人力、物力和时间, 有效地控制和估计试验误差, 获得准确可靠的试验结果。而是等试验结束后,急需发表文章或参加考核时,才想到要用统计学来为他的试验数据进行“修饰”。此时,常常会出现这样的现象:由于试验缺乏完善的设计方案的指导,要么数据量不够,要么严重地违背了试验设计的基本原则,导致所收集的资料无法处理,或统计结论与专业知识自相矛盾, 或结论模棱两可。

定量资料集中趋势的度量 常用下列平均指标来描述, 即算术均数、几何均数、调和均数、中位数和众数。

定量资料离散趋势的度量 常用下列变异指标来描述, 即标准差、标准误差、变异系数、极差和四分位数间距。

随机变量及其概率 包括离散型随机变量的概率(如:二项、泊松、几何、超几何等)和连续型随机变量的概率(如: 正态、t、卡、F、对数正态、指数、图尔等)(**)。

定量资料趋势的度量 常用的指标有分位数、偏度系数和峰度系数。

定性资料的统计描述─相对指标(包括比和率)。

以上内容将在第1篇第3章中介绍。

学习和使用统计方法的全过程可划分为以下3部分:其一,对统计学的概念和方法有一个大概的了解,以便根据具体情况正确选用统计方法;其二,正确运用统计算方法处理实际资料;其三,把专业与统计知识紧密结合起来,对计算结果给出合理的解释,从而,作出科学的结论。对于非统计工作者来说,第2部分是最大的障碍, 因为处理多因素多指标资料的算法复杂、计算量大!

学习统计方法的捷径是: 利用现成的统计软件包在电子计算机上实现各种复杂的统计计算, 只需花较少的时间和精力去学习第1、3两部分内容。

一个设计优良的试验方案的意义就在于它能用比较经济的人力、物力和时间,得到较为可靠的结果,准确地控制和估计误差的大小, 还可使多种试验因素包括在尽可能少的试验中,达到高效的目的。

随机、重复、对照和均衡是试验设计的4个基本原则。

在统计学中,常把“试验因素、受试对象和试验效应”称为试验设计的三要素,

(1)统计分析时误差项相对固定的设计类型(结果变量为定量资料) 具体的有:单组设计、配对设计、成组设计、单因素k(k≥3)水平设计、配伍组设计、交叉设计、拉丁方设计、希腊拉丁方设计、析因设计、含区组因素的析因设计、正交设计、尧敦方设计。

(2)统计分析时误差项不固定的设计类型(结果变量为定量资料) 具体的有: 平衡不完全区组设计、系统分组(或嵌套)设计、分割(或裂区)设计、具有重复测量的设计。

(3)列联表资料的设计类型(结果变量为定性资料) 一般只分配对设计和非配对设计。

2.与回归分析有关的设计类型─均匀设计、回归的正交设计、回归的旋转设计等。

3.边试验边分析的设计类型─序贯试验设计。

表中只含1个分组标志时,称为简单表;含2个及以上分组标志时,称为复合表。复合表的模式见表1.3.1。

平均指标用来反映一群性质相同的数据的平均水平或集中趋势。常用的平均指标有5种,即算术均数、几何均数、调和均数、中位数和众数。

变异指标用来反映一群性质相同数据的离散程度的大小, 常用的变异指标有标准差、方差、标准误差、变异系数等。

参数估计就是用样本统计量来估计总体参数, 它包括点估计和区间估计。点估计给出被估计参数的一个适当的估计值; 区间估计是给出被估计参数的可能的数值范围。这种区间称为置信区间或可信区间。

置信区间 按预先给定的概率1-α(通常取为0.95或0.99),估计未知参数值的可能范围,这个范围称为被估计参数的100(1-α)%置信区间。1-α称为置信度或置信水平,α称为显著性水平,也是估计出错的概率。

推断定量资料情况有2个常用的统计量,即偏度系数g1与峰度系数g2,

原假设:根据检验结果准备予以拒绝或接受的假设,以H0表示;备择假设:与原假设不相容(即对立)的假设,以H1表示。

检验统计量的函数依赖于观测值的函数类型的检验,称为参数检验;如当总体的方差未知时,对于原假设“均数等于某给定值”的t检验中, 必须假定总体的是正态的。反之,则称为非参数检验。